Meta-Aligner: Optimización Bidireccional de Preferencia-Política para la Alineación de LLMs Multiobjetivo
Meta-Aligner: alineación multiobjetivo de LLMs. Optimiza modelos de lenguaje con múltiples objetivos, mejorando rendimiento y adaptabilidad. Descubre cómo funciona.